"Un computer per tutti"
Progetto Ateneo 3a Missione
Obiettivi¶
- Donare PC
- Analisi Data Driven del fenomeno del Digitla Divide
- Workshop
Divario Digitale (Digital Divide)¶
Il divario digitale è il divario esistente tra chi ha accesso effettivo alle tecnologie dell'informazione (in particolare personal computer e Internet) e chi ne è escluso, in modo parziale o totale. I motivi di esclusione comprendono diverse variabili: condizioni economiche, livello d'istruzione, qualità delle infrastrutture, differenze di età o di sesso, appartenenza a diversi gruppi etnici, provenienza geografica[2]. Oltre a indicare il divario nell'accesso reale alle tecnologie, la definizione include anche disparità nell'acquisizione di risorse o capacità necessarie a partecipare alla società dell'informazione: nei paesi avanzati, e specie nella popolazione giovane, infatti, il divario di meno accesso alla rete è ormai quasi del tutto colmato e si apre invece un divario digitale di secondo livello basato sulle modalità di fruizione (Wikipedia)
Il termine "divario digitale" può essere utilizzato sia per riferirsi ad un divario esistente tra diverse persone, o gruppi sociali in una stessa area, che al divario esistente tra diverse regioni di uno stesso stato, o tra stati (o regioni del mondo) a livello globale. (Wikipedia)
Analisi Data Driven del fenomeno del Digitla Divide nella scuola¶

Ipotesi¶
Se uno strumento digitale così importante viene usato poco ci può essere un problema di Digital Divide
Data as Excel files¶

Capire la struttura dei dati¶
- EE = Elementari
- MM = medie
- SS = Superiori
- ACso = il grado per esempio la prima media è MM 1, il quarto superiore è SS 4
- Alu = Alunni
- Tut = Tutori
- Maschio
- Femmina
- Italiani
- Stranieri
import pandas as pd
sheets = ['Dati_Sett 2022','Dati_Ott 2022','Dati_Nov 2022','Dati_Dic 2022','Dati_Gen 2023','Dati_Feb 2023','Dati_Mar 2023','Dati_Apr 2023','Dati_Mag 2023','Dati_Giu 2023']
dfs = []
for sheet in sheets:
dfs.append(pd.read_excel('Sapienza2.xlsx', sheet_name=sheet))
df_months_logs = pd.concat(dfs, ignore_index=True)
Esportare i dati in formato non proprietario¶
df_months_logs.to_csv("months_log.csv",index=False)
Da 0 a 3 stelle!¶

I dati sono disponibili su https://github.com/andreavitaletti/un_computer_per_tutti/
Analisi dei dati¶
import pandas as pd
df_all_from_csv = pd.read_csv("months_log.csv")
Dati sugli accessi¶
Quanti sono gli accessi mensili per tiplogia di utente ?¶
months = [9,10,11,12,1,2,3,4,5,6]
accessi_totali_per_mese = []
accessi_totali_tutori_italiani_per_mese = []
accessi_totali_tutori_stranieri_per_mese = []
accessi_totali_alunni_italiani_per_mese = []
accessi_totali_alunni_stranieri_per_mese = []
for month in months:
mask = (df_all_from_csv['DataLogin'].dt.month == month)
accessi_totali_per_mese.append(df_all_from_csv.loc[mask]['Totale'].sum())
accessi_totali_tutori_italiani_per_mese.append(df_all_from_csv.loc[mask]['TutITA'].sum())
accessi_totali_tutori_stranieri_per_mese.append(df_all_from_csv.loc[mask]['TutSTRA'].sum())
accessi_totali_alunni_italiani_per_mese.append(df_all_from_csv.loc[mask]['AluITA'].sum())
accessi_totali_alunni_stranieri_per_mese.append(df_all_from_csv.loc[mask]['AluSTRA'].sum())
Accessi per regione¶
Gli uomini o le donne sono "tutori più partecipi"?¶
# percentuale di tutori femmine che accede al registro elettronico
sum(accessi_totali_tutori_femmine_per_mese)/sum(accessi_totali_tutori_per_mese)
0.7389560830476684
Gli uomini o le donne sono "alunni più partecipi"?¶
# percentuale di studenti femmine che accede al registro elettronico
sum(accessi_totali_alunni_femmine_per_mese)/sum(accessi_totali_alunni_per_mese)
0.5239771965124078
Dati sulle classi¶
riferimento solo alla versione 2.0 utilizzato da circa la metà delle nostre scuole (circa 1000)
df1 = pd.read_csv("class_data.csv")
# classi gestite dal nostro registro (si fa riferimento solo alla versione 2.0 utilizzato da circa la metà delle nostre scuole (circa 1000)
print("Totale alunni:",df1["Alunni"].sum())
print("Totale classi:",df1["Classi"].sum())
Totale alunni: 49169 Totale classi: 2724
NOTA: Mancano dati per alcune regioni (es: Abruzzo)
Indice di "Partecipazione"¶
$$ \text{Indice di partecipazione} = \frac{\text{Accessi degli Alunni per Regione}}{\text{Alunni per Regione}}$$
Ipotesi: Quanto più grande è l'indice di partecipazione tanto minore è il problema del Digital Divide
Numero Accessi per Regione¶
| AluTot | |
|---|---|
| Regione | |
| ABRUZZO | 1 |
| BASILICATA | 0 |
| CALABRIA | 66 |
| CAMPANIA | 1579 |
| ESTERO | 172 |
| FRIULI VENEZIA GIULIA | 42 |
| LAZIO | 1602 |
| LIGURIA | 3441 |
| LOMBARDIA | 9728 |
| MARCHE | 148 |
| PIEMONTE | 4 |
| PUGLIA | 245 |
| SARDEGNA | 6 |
| SICILIA | 471 |
| TOSCANA | 270 |
| UMBRIA | 50 |
| VENETO | 67 |
Alunni nelle classi per regione¶
NOTA: mancano dati per alcune regioni
| Alunni | |
|---|---|
| Regione | |
| BASILICATA | 447 |
| CALABRIA | 4380 |
| CAMPANIA | 3044 |
| ESTERO | 695 |
| FRIULI VENEZIA GIULIA | 1599 |
| LAZIO | 5552 |
| LIGURIA | 2378 |
| LOMBARDIA | 5468 |
| MARCHE | 4661 |
| MOLISE | 609 |
| PIEMONTE | 3042 |
| PUGLIA | 4880 |
| SARDEGNA | 1967 |
| SICILIA | 2991 |
| TOSCANA | 4530 |
| UMBRIA | 1356 |
| VENETO | 1570 |
Conclusioni¶
- Fenomeno varigato e complesso
- Gli open data possono essere uno strumento utile
- Necessità di integrare diverse fonti per aumentare qualità e quantità dei dati
- Indice di partecipazione basso
- Monitoraggio continuo


